Auto Research时代,47个没有标准答案的任务成了Agent能力必测榜 Auto Research时代,47个没有标准答案的任务成了Agent能力必测榜 关键词: AI新闻,Einsia AI,Navers lab,Frontier-Eng Bench 如果把AI丢进一个没有标准答案的工程现场,它还能活下来吗? 来自主题: AI技术研报 10001 点击 2026-05-13 15:02